The Making of Community Notes—Asterisk
public.icon
(Jay Baxter)私はバードウォッチ1での機械学習、投票、報酬モデル作業の最初のリーダーでした コミュニティ ノートのアイデアはどこから来たのですか?
人々はソーシャル メディアで正確な情報を入手したいと考えているが、それは非常に難しいという観察から始まりました。明らかに誤解を招く情報が飛び交っていました。企業が使用していた主なアプローチは、何が正確で何が不正確で、何が許可されているかを決定する社内の信頼チームと安全チームの組み合わせ、またはそれらの決定を下そうとする専門のメディア組織とのパートナーシップでした。どちらも 3 つの大きな課題を抱えていました。 1 つはスピードです。ソーシャル ネットワークやインターネット上では情報が非常に速く移動します。これらの信頼性と安全性、またはファクト チェッカーの決定には、請求の確認に数日かかることが実際によくありました。これは、インターネット時間に換算すると無限に相当します。
かなり早い段階から、クラウドソーシングが潜在的なソリューションの可能性があることは明らかでした。Wikipediaは明らかに巨大な規模に達していました。どの百科事典よりも大きいと思います。速かったですね。通常、ニュース記事が変わると数分以内に更新されます。信頼性の面と偏見の面でいくつかの課題がありました。しかし、私たちは、それらを克服できれば、おそらくうまくいくだろうと考えました。それがコンセプトの起源のようなものでした。私たちはそれがどのようなものになるかについて、いくつかの異なるアイデアを試作しました。そして、それらのアイデアの 1 つは、X 上の人々 (当時は Twitter でした) が投稿に表示できるメモを投稿している様子を描いたモックアップ、プロトタイプを示していました。そのメモが合理的であれば、その投稿を見た人はメモを読むだけで自分なりの結論に達できるだろう、という考えでした。 birdwatchのパイロット版は 2021 年 1 月ですよね?したがって、これは長いプロトタイピング段階です。 コミュニティ ノートのもう 1 つの非常に有名な要素は、少なくとも特定のサークルではブリッジ アルゴリズムです。ブリッジ アルゴリズムとは、有益で政治的に二極化していないノートを選択するために製品が使用するアルゴリズムです。おそらくジェイが一番よく話せると思いますが、デザインプロセスのどこで最初に思いついたのか、そしてその背後にあるプロセスをぜひ知りたいです。
当初から、私たちはこのメモが政治的領域全体で役に立つと思われるようにしたいという考えを持っていました。しかし、考慮すべき点はたくさんあります。私たちは操作耐性のバランスをとっており、私たちのように完全にオープンソースのデータセットとオープンソースのアルゴリズムを持っている場合、単純に投票を合計して誰が最も多くの権利を持っているかなどを確認することはできません。そこで、PageRank など、ある程度の操作耐性を持つさまざまなクラスのアルゴリズムを検討しました。 2 実際、私たちは PageRank バリアントの作業に多くの時間を費やしました。 基本的に多数の実装を実装し、多くの属性でそれらを評価した後、ブリッジング アルゴリズムにたどり着きました。評価するのは明らかに難しいですが、これらのテストではブリッジング アルゴリズムが最高のパフォーマンスを示しました。この自然な操作耐性が得られ、政治的スペクトル全体にわたって役立つと思われるメモのみが表面化するのは非常に素晴らしいことだと思います。
それがどのように機能するのか説明してもらえますか?
主な評価アクションは、ノートが役に立ったかどうかを人々に尋ねることです。次に、以前のノートに対する人々の評価履歴を調べます。このアルゴリズムが行うことは、過去に評価に同意しなかった人々が、実際に特定のメモが役に立つと同意しているメモを見つけることです。これは政治的軸に基づいて明確に定義されているわけではなく、純粋に人々の投票履歴に基づいています。そして、このメカニズムにより、非常に正確なメモが得られます。なぜなら、実質的に意見が異なる人々の間に政治的な二極化が存在する場合、実際には、メモが非常に正確である場合にのみメモが有益であることに同意する傾向があるからです。
このアルゴリズムを説明した論文に、興味深いグラフがあります。 y 軸には有用性があり、x 軸には二極化があると思います。そして、このひし形の形が得られます。これは、ほとんどのメモがどちらか一方に非常に偏っていて、中程度しか役に立たないことを示していますが、非常に役立つ超偏ったメモはほとんどありません。上部には、分極化されていない有益なノートの明確なバンドが有機的に流れ出ています。これは単に人々の評価行動から自然に出たものなのでしょうか?
https://gyazo.com/2a479881c065bf99d09a26ed741d56ab
新しいコンテンツモデレーション方法の開発に関して学んだ最大の教訓は何ですか?他の企業のチーム、またはこの問題に幅広く取り組んでいる人々に一番言いたいことは何ですか?
モデレーション分野における最大の課題の 1 つは、人々が公平だと感じる結果を提供することです。コミュニティ ノートが優れていると思うことの 1 つは、人々が公平で役立つと感じるノートを配信する傾向があることです。そして、誰もが発言権を持っているため、そのプロセスは比較的公平であると彼らも感じていると思います。これは一般に公開されているオープンソース データとコードに基づいているため、人々はそれを監査し、批判することができます。モデレーションの他の分野でも、これと同じ公平性の課題に直面しています。私は、人々が信頼するオープンで公正な方法でこれらの決定を下そうとする新しいアプローチを見てみたいと思っています。私は、彼らは本当に成功するだろうし、最終的には、たとえ反対意見であっても、人々が支持する可能性のある、これらの本当に物議を醸す決定に関する結果につながる可能性があると思います。